home *** CD-ROM | disk | FTP | other *** search
/ PC World Komputer 2010 April / PCWorld0410.iso / hity wydania / Ubuntu 9.10 PL / karmelkowy-koliberek-desktop-9.10-i386-PL.iso / casper / filesystem.squashfs / usr / share / pyshared / chardet / charsetprober.py < prev    next >
Text File  |  2006-10-21  |  2KB  |  61 lines

  1. ######################## BEGIN LICENSE BLOCK ########################
  2. # The Original Code is Mozilla Universal charset detector code.
  3. # The Initial Developer of the Original Code is
  4. # Netscape Communications Corporation.
  5. # Portions created by the Initial Developer are Copyright (C) 2001
  6. # the Initial Developer. All Rights Reserved.
  7. # Contributor(s):
  8. #   Mark Pilgrim - port to Python
  9. #   Shy Shalom - original C code
  10. #
  11. # This library is free software; you can redistribute it and/or
  12. # modify it under the terms of the GNU Lesser General Public
  13. # License as published by the Free Software Foundation; either
  14. # version 2.1 of the License, or (at your option) any later version.
  15. # This library is distributed in the hope that it will be useful,
  16. # but WITHOUT ANY WARRANTY; without even the implied warranty of
  17. # MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
  18. # Lesser General Public License for more details.
  19. # You should have received a copy of the GNU Lesser General Public
  20. # License along with this library; if not, write to the Free Software
  21. # Foundation, Inc., 51 Franklin St, Fifth Floor, Boston, MA
  22. # 02110-1301  USA
  23. ######################### END LICENSE BLOCK #########################
  24.  
  25. import constants, re
  26.  
  27. class CharSetProber:
  28.     def __init__(self):
  29.         pass
  30.         
  31.     def reset(self):
  32.         self._mState = constants.eDetecting
  33.     
  34.     def get_charset_name(self):
  35.         return None
  36.  
  37.     def feed(self, aBuf):
  38.         pass
  39.  
  40.     def get_state(self):
  41.         return self._mState
  42.  
  43.     def get_confidence(self):
  44.         return 0.0
  45.  
  46.     def filter_high_bit_only(self, aBuf):
  47.         aBuf = re.sub(r'([\x00-\x7F])+', ' ', aBuf)
  48.         return aBuf
  49.     
  50.     def filter_without_english_letters(self, aBuf):
  51.         aBuf = re.sub(r'([A-Za-z])+', ' ', aBuf)
  52.         return aBuf
  53.         
  54.     def filter_with_english_letters(self, aBuf):
  55.         # TODO
  56.         return aBuf
  57.